home *** CD-ROM | disk | FTP | other *** search
/ InfoMagic Internet Tools 1995 April / Internet Tools.iso / infoserv / www / cern / dev / www-talk.9301-9306.Z / www-talk.9301-9306 / text0179.txt < prev    next >
Encoding:
Text File  |  1995-04-24  |  2.6 KB  |  56 lines

  1. I have been troubled by the fact that HTML documents look like SGML documents,
  2. but technically, they are not. So I have tried to come up with a DTD that
  3. captures the features of HTML.
  4.  
  5. I have come to the conclusion that HTML has very little structure, and that this
  6. is by design.
  7.  
  8. I am beginning to wonder how much the needs of WWW have in common with the
  9. features of SGML.
  10.  
  11. It seems to me that SGML is the technology of choice when you have a community
  12. of information consumers and producers that share a common structure. e.g. the
  13. construction industry might use SGML to exchange bill of materials, parts lists,
  14. inventories, etc. The SGML parser would be used to verify part numbers, make
  15. sure every widget has a corresponding gadget, etc.
  16.  
  17. The WWW project is a form of electronic publishing, however, and publishing is a
  18. natural application of SGML. But the value of SGML is that you can verify the
  19. structure of the text. A publisher can specify in his DTD the format
  20. of references, bibliography entries, the placement of the abstract, etc.
  21.  
  22. The WWW project has no such editorial policies to enforce. The editorial
  23. policies set forth in the HTML tag set are things like "you can have a title, if
  24. you want, and we'll keep it visible for the user; you can have headings and
  25. paragraphs and glossaries and lists and menus, and as long as you use them
  26. in pretty much the traditional way, they'll be formatted reasonably. And
  27. you can have anchors -- references from/to other documents."
  28.  
  29. The question that recently came into my mind is: why is the WWW project
  30. defining such a tag set? The practical answer is that the NeXT implementation
  31. has a nifty editor, and we'd like to be able to write nicely formatted documents
  32. and display them nicely on nice terminals and simply on simple terminals.
  33.  
  34. Honestly, for that purpose, RTF is a more mature technology. The NeXT has
  35. extensive support for RTF, and the Mac and the PC have some support.
  36.  
  37. I think all we're lacking is public implementations of RTF->ASCII,
  38. RTF->Postscript, and RTF->X Windows renderers. MS Word and NeXT
  39. edit would be fine editors. Really, for the kind of casual documents
  40. the WWW project deals with, SGML is not a good match. Who really
  41. uses all the "format independent" features of WWW? I haven't seen
  42. anything that the RTF stylesheet features can't handle.
  43.  
  44. Unless we want some part of the WWW system to verify the structure
  45. of documents, why are we using SGML (and using it poorly)?
  46.  
  47. Granted RTF doesn't have very good hypertext and multimedia features,
  48. but that's what the WWW project is all about: experimenting with
  49. hypertext and multimedia. We could standardize multimedia RTF conventions
  50. as well as we have done for SGML.
  51.  
  52. Comments?
  53.  
  54. Dan
  55.  
  56.